home
***
CD-ROM
|
disk
|
FTP
|
other
***
search
/
Aminet 52
/
Aminet 52 (2002)(GTI - Schatztruhe)[!][Dec 2002].iso
/
Aminet
/
docs
/
mags
/
saku09.lha
/
Teksti
/
HTML.txt
< prev
next >
Wrap
Text File
|
1994-10-21
|
12KB
|
228 lines
5
1*
{3 HTML ja WWW - hypertekstin suuri mahdollisuus
{3 ---------------------------------------------
Antti Vähä-Sipilä
{3Mitä on HTML?
{3-------------
Hyperteksti on nykyään pinnalla varsinkin Internetistä puhuttaessa. Mitä tämän
termin taakse kätkeytyy? Hyperteksti on lyhyesti määriteltynä joukko dokumentte-
ja, jossa käyttäjä voi siirtyä dokumentista toiseen sen mukaan, mikä sattuu
kiinnostamaan. Hypertekstiin voidaan liittää kuvia, animaatioita, musiikkia ja
puhetta, ja sen ympärille voidaan luoda täydellinen hyper/multimediaesitys
käytettävissä olevan laitteiston ja tiedonsiirtoverkon kapasiteetin rajoissa.
Pieni yksinkertainen esimerkki havainnollistanee asiaa. Luet juuri Amigan pro-
sessorista kertovaa tekstiä, jossa esiintyy sana 68040. Teksti jatkuu kuvaillen
PowerPC:tä, mutta olet enemmän kiinnostunut Motorolan luomuksista - siksi klik-
kaat hiirelläsi "68040":aa, ja ruudulle ilmestyy lisätietoa tästä avainsanasta.
Tästäkin dokumentista pääset taas eteenpäin ja niin edelleen. Teoriassa yhteen
hypertekstiin voidaan mahduttaa kaikki maailman oleellinen tieto.
Hyperteksti ei ole muodikkuudestaan huolimatta mikään uusi ilmiö. Mikäli luet
tätä artikkelia AmigaGuidella, luet sitä hypertekstinä. AmigaGuide on hyvin tyy-
pillinen perushyperteksti. Se mahdollistaa tekstilinkkien (linkki on hyppy doku-
mentista toiseen) lisäksi ulkoisten ohjelmien ajamisen, jolloin voidaan esimer-
kiksi katsoa kuvia tai kuunnella musiikkia. AmigaGuide näyttää tekstin tavalli-
sessa ikkunassa, joten esimerkiksi Sakua lukiessa hypertekstistä saa hiukan ka-
run vaikutelman. Hypertekstin suosio kasvaa koko ajan, ja yhä useammissa PD- ja
Shareware-ohjelmissa on dokumentointi ainoastaan AmigaGuiden .guide-loppuisena
tiedostona.
AmigaGuidessa on kuitenkin tiettyjä rajoituksia. Dokumenttien on käytännössä ol-
tava samalla koneella, mikä rajoittaa tiedon määrää. AmigaGuide-yhteensopivia
lukuohjelmiakaan ei ole olemassa kuin Amigalle ja PC:lle. Ratkaisu tähän on
standardeihin pohjautuva HTML-kieli.
HTML tulee sanoista HyperText Markup Language. Sillä kuvataan näytettävä doku-
mentti erittäin samankaltaisella tyylillä kuin AmigaGuide, yleensä kylläkin jo-
kainen linkki jaetaan omaksi .html-loppuiseksi tiedostokseen. Myös tiedoston
sisälle pystyy muodostamaan linkkejä kuten AmigaGuidessakin. HTML-dokumenttien
lukemiseen on kehitetty useita lukuohjelmia, joista tunnetuimmat ovat tekstipoh-
jaisille käyttöliittymille Lynx ja graafisille Mosaic.
Kun esimerkiksi Mosaic käynnistetään, se hakee ja näyttää aloitusdokumentin.
Siitä eteenpäin Mosaic toimii AmigaGuiden kaltaisesti kuitenkin sillä erolla,
että linkki, joka dokumentissa on, voi osoittaa vaikka toisella puolella maail-
maa olevaan dokumenttiin. Nämä yhteenliitetyt linkit muodostavat Internetissä
maailmanlaajuisen World Wide Web - eli WWW- eli W3-verkon. Tavallinen käyttäjä
ei huomaa maailmanlaajuisuutta kuin pitkistä hakuajoista (mikäli dokumentti hae-
taan jostain hyvin kaukaa ruuhka-aikana) ja satunnaisista yhteydenottovaikeuk-
sista (Internet on tunnettu siitä, ettei mikään yhteys ole sataprosenttisen var-
masti pystyssä).
Internetissä on arviolta 30 miljoonaa käyttäjää ja miljoonia tietokoneita. Kas-
vuvauhti on arvioitu (juuri WWW:n suosion ansiosta) 20 prosentiksi kuukaudessa.
Miten omassa Amigassasi pyörivä pikku AMosaic voi löytää juuri sen oikean tie-
doston näiden miljoonien koneiden kovalevyjen hakemistojen sokkeloista? Ratkaisu
on URL, Uniform Resource Locator eli "yhtenäinen resurssienpaikallistin". Se on
rivi tekstiä, joka koostuu protokollasta, koneen nimestä, sen sijainnista ja
tiedoston sijainnista tällä koneella.
Esimerkiksi Sakun kotisivu WWW:ssä sijaitsee osoitteessa
http://proffa.cc.tut.fi/~v150105/saku.html
Kun AMosaic saa tämän rivin, se ensinnäkin tietää, millainen yhteys sen täytyy
ottaa, jotta dokumentti irtoaisi. HTTP on HyperText Transfer Protocol eli proto-
kolla HTML-tiedostoja varten. Seuraavaksi ohjelma näkee, minne HTTP-pyyntö on
lähetettävä; kone on Suomessa (fi) sijaitseva Tampereen teknillisen korkeakoulun
(tut) laskentakeskuksen (cc) opiskelijakone "proffa". Sen kovalevyiltä löytyy
käyttäjän v150105 kotihakemisto, jossa on dokumentti saku.html. (Itse asiassa
tässä tapauksessa dokumentti saku.html ei sijaitse tässä hakemistossa, vaan ai-
van muualla - mutta siitä taas ei URL:n käyttäjän kannata välittää; kyseessä on
symbolinen linkki.)
Myös muunlaisia URL:eja on mahdollisuus tehdä. Protokollista käytössä ovat mm.
FTP, jolloin lukuohjelma toimii ftp-ohjelman tavoin. Sakun lähes kaikki aikai-
semmat numerot löytyvätkin URL:sta
ftp://ftp.funet.fi/pub/amiga/misc/diskmags/Finnish/
Vanhempi tiedonetsintäohjelma Gopher on myös tuettujen protokollien joukossa, ja
lisäksi lukuohjelmilla voi sopivilla URL:eilla lähettää mailia ja lukea
newssejä.
Kun WWW:ssä liikkuu ja seuraa kiinnostavalta tuntuvia linkkejä, voi äkkiä löytää
itsensä esimerkiksi Etelä-Afrikasta. Eksyminen on helppoa, mutta onneksi ohjel-
missa on muutama edellinen linkki tallessa, jotta taaksepäin voi palata. Vaikeu-
tena on suuren suuresta valikoimasta löytää haluamansa tieto. Siihen auttaa
FAQ-tiedostojen lukeminen, WWW-uutisryhmien aktiivinen seuraaminen ja hakemisto-
sivujen käyttö. Parhaimmilla hakemistosivuilla on satoja linkkejä tärkeimpiin
paikkoihin. WWW:stä löytyvät esimerkiksi tämänhetkiset sääsatelliittikuvat
ympäri maapallon. WWW ja Internet ovat niin laajoja käsitteitä, etten niihin
tämän enempää paneudu. Aloittelija voi lainata kirjastosta Kari Hintikan kirjan
"Internet: Kalastusta tietoverkoilla", jonka pitäisi olla varsin hyvä esittely
asiasta.
Palataan vielä AmigaGuideen. Esimerkiksi Saku julkaistaan aina diskettilehden
lisäksi AmigaGuidena ja nykyään myös HTML-dokumenttina, jotka saa luettavakseen
URL:sta http://proffa.cc.tut.fi/~v150105/saku.html. Koska AmigaGuide ja HTML
ovat niin lähellä toisiaan, syötämme vain valmiin .guide -tekstin kuvineen
päivineen ohjelmalle, joka sylkäisee toisesta päästä kasan .html-tiedostoja. Ku-
vat käännetään GIF:eiksi, koska GIF on (de facto?) standardi tekstin seassa
näytettäville kuville (nk. inline images).
AmigaGuidesta HTML:ään kääntäviä ohjelmia on ainakin kaksi, jotka löytyvät Ami-
netistä. Toinen on perl-skripti, ag2html, jota on käytetty Sakun käännöksessä.
Toinen on C-kielinen ohjelma guide2html. Ne ovat periaatteessa aivan toisiaan
vastaavia. Päinvastaiseen suuntaan kääntävän ohjelman tekeminen ei ole sen vai-
keampaa, mutta niitä ei ole näkynyt, ja niille onkin vähemmän käyttöä. Ohjelmat
saa ainakin Aminetin FTP-siteilta.
Ag2html-skriptin saat itsellesi esimerkiksi Sakun kotisivuilta löytyvästä lin-
kistä. Jokaisen käännetyn AG-sivun loppuun ilmestyy tämän käännösohjelman "mai-
nos".
Seuraavassa osuudessa käyn lähemmin läpi, miten saat nopeasti tehtyä itsellesi
oman sivun WWW:hen, jos sinulla on Internetiin kiinteästi liitetty kone tai tun-
nus esimerkiksi korkeakoulun tai kaupallisen laitoksen koneella.
{3 Kuinka luon oman WWW-kotisivun?
{3 -------------------------------
{31. Perusteet
{3------------
Haluat siis tehdä verkkoon oman WWW-kotisivun. Jos koneellasi on muillakin sel-
laisia, niin asian pitäisi onnistua. Muutoin ota yhteyttä koneesi ylläpitoon ja
kysy, onko se mahdollista.
Dokumentit löytyvät kotihakemistossasi olevasta public_html-nimisestä hakemis-
tosta, joten luo sellainen. Oletusarvoinen aloitusdokumentti on tekstitiedosto
nimeltä index.html, eli tee editorillasi kyseinen dokumentti, jossa lukee
<html><head></head><body></body></html>
Olet juuri tehnyt itsellesi tyhjän kotisivun WWW:hen. Kotisivusi URL on
http://koneesi.nimi.tähän/~käyttäjätunnus/ jossa "koneesi.nimi.tähän" muuttuu
esimerkiksi "mits.mdata.fi":ksi ja ~käyttäjätunnus on kotihakemistosi (~ tar-
koittaa kotihakemistoa), esimerkiksi ~avs.
Jos koneessasi näin on päätetty, sivusi ilmestynee viimeistään seuraavana yönä
viralliseen kotisivulistaan. Yleensä URL on tällöin muotoa http://www.konee-
si.nimi/~käyttistunnus/. Tämä vaihtelee systeemin ylläpidosta riippuen.
Kysäisepä sysadminiltasi.
{32. Tietoa tarjolle
{3------------------
Päätä ensin sivusi nimi. Lisää <head>- ja </head>-merkintöjen väliin teksti
<title>Sivuni nimi</title>. Olet juuri saanut valmiiksi sivun otsikkokentän.
HTML-kieli jakaa tekstin kenttiin, jotka alkavat <komento>- tunnuksella ja
päättyvät </komento>-tunnukseen. Ensimmäinen kenttä on <html>, joka ilmaisee
HTML-kielisen dokumentin alkamisen. <head> ilmaisee otsikkokentän alun, <title>
sivun nimen. </title></head> lopettavat otsikkokentän ja <body> aloittaa varsi-
naisen sivun rungon. Sivu tulee tähän väliin ja ihan viimeiseksi jätetään </bo-
dy></html>.
Varsinainen tarjoamasi tieto tulee siis <body>- ja </body>-lausekkeiden väliin.
Tekstin voi kirjoittaa ilman, että huolehtii paljon sen ulkoasusta; WWW-lukija
taittaa tekstin sivulle järkevän näköisesti. Nyt voit jo kirjoittaa jotain jut-
tua sivulle. Seuraavaksi katsomme, miten saat sivusi pelkästä tekstistä hyper-
tekstiksi.
{33. Linkkejä maailmalle
{3----------------------
Linkit muodostetaan komennolla <a> eli anchor. Koko linkin syntaksi on <a
href="URL">Linkki</a>, jolloin sanaa "Linkki" klikkaamalla käyttäjä siirtyy do-
kumenttiin, johon osoittaa URL.
URL voi olla myös suhteellinen, eli pelkkä <a href="osoitteet.html"> siirtää
käyttäjän samassa hakemistossa olevaan osoitteet.html-nimiseen dokumenttiin.
Esimerkkejä URLeista, kokeile:
http://proffa.cc.tut.fi/~v150105/saku.html (HTTP-yhteys Sakun sivuille)
ftp://ftp.cdrom.com/pub/aminet/ (FTP-yhteys Aminettiin)
gopher://oulu.fi/ (Oulun Gopher-yhteys)
gopher://mits.mdata.fi:79//avs (Finger-komento)
mailto:v150105@cc.tut.fi (Lähettää mailia)
news:sfnet.atk.amiga (Lukee uutisryhmää)
Lisää URL-esimerkkejä löytyy kaikista WWW:tä käsittelevistä uutisryhmistä.
{34. Hienosäätöä
{3--------------
HTML-kieli on varsin monipuolinen, ja tuleva HTML+ on vielä laajempi. Näin pi-
kaisessa aloittelijan oppaassa on turha käydä kaikkia aspekteja läpi; verkosta
löytyy paljon hyviä oppaita (kotisivultani pääsee ainakin erittäin hyvään oppaa-
seen). Käsitellään lyhyesti pari oleellista asiaa tulostuksen muotoilun osalta:
<pre> ja </pre> aiheuttavat sen, että näiden välissä oleva teksti näytetään
non-proportional-fontilla, eli jokainen kirjain vie saman verran tilaa ja että
tekstin muotoilu on juuri se mitä haluat (pre=preformatted).
<br> katkaisee rivin juuri siitä (br=break).
<ul> aloittaa listan (ul=unbulleted list). Listoja on useita tyyppejä, tämä
niistä yksi. Jokainen listan rivi laitetaan <li>- ja </li>-komentojen väliin
(li=list), ja lista lopetetaan </ul>:llä, esimerkiksi:
<ul>
<li>Rivi 1</li>
<li>Rivi 2</li>
<li><a href="foo.html">Tämä rivi sisältää linkin</a></li>
<li>Rivi 4</li>
</ul>
<p> ja </p> rajaavat tekstikappaleen (p=paragraph). Itse asiassa näitä ei _tar-
vitsisi_ käyttää pareina, mutta HTML-kielen määritelmän mukaan näin täytyy
tehdä. Siksi suosittelen, että _jokainen_ komento annetaan aina täydellisenä,
eli dokumentissa on sekä komennon aloitus- että lopetusmerkit.
Jos näet jollakin sivulla hienon trikin, voit oppia, miten se tehdään, kun
käytät WWW-lukijasi View Source -toimintoa, Lynxillä ainakin joissain versioissa
\-merkki.